Model Selection

Low-latency speech generation

# Low-latency speech generation

Kimi-Audio is an open-source foundational audio model that excels in audio understanding, generation, and dialogue.

Speech Recognition Supports Multiple Languages

Seamless M4t V2 Large

SeamlessM4T v2 is a large-scale multilingual multimodal machine translation model released by Facebook, supporting speech and text translation for nearly 100 languages.

Transformers Supports Multiple Languages

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase